機器學習就是電腦根據過去的經驗自動學習,並運用學習結果解決問題。聽起來很簡單,但是在應用機器學習方法以前需要許多背景知識的基礎,例如統計學、微積分、線性代數等,要深入了解不是件容易事。
那與人工智慧(Artificial Inteligence)、深度學習(Deep learning)有什麼不同呢? 人工智慧是一個概括的詞,其包含了機器學習與深度學習;機器學習為人工智慧實現的其中一種方法,而深度學習為機器學習特定的演算法。他們的關係圖如下:
監督式學習(Supervised learning)
如果輸入電腦的資料有答案時,此方法稱為監督式學習。以預測今日的股價漲或跌為例,我們將過去五天的開盤價與收盤價當作輸入資料,輸出的資料為今日收盤價。輸入的資料通常稱為特徵,而輸出資料稱為標籤,因為此為分類問題(Classification)。當此問題變成預測今日的收盤價,也就是依變數(Dependent variable)為連續變數時,則為迴歸問題(Regression)。
常見的演算法有線性迴歸(Linear regression)、羅吉斯迴歸(Logistic regression)、支持向量機(Support vector machine)、貝氏分類器(Bayesian classification)、決策樹(Decision tree)、K-最近鄰法(K-Nearest neighbors)與線性判別分析(Linear discriminant analysis)等。
非監督式學習(Unsupervised learning)
非監督式學習的問題沒有正確的解答,學習找出資料的特性。
常見的演算法有主成分分析(Principal component analysis)以及K-means等。
強化式學習(Reinforcement learning)
強化式學習目標為基於環境而行動,以最大化利益為原則。本系列文章的重點不於此方法,因此不會有過多的著墨。
在我們的生活周遭都有許多物品應用了機器學習方法,例如語音助理Siri,使用自然語言處理的技術,將人類所說的語音轉換成文字,並且依據文義,找出最適合的答案,呈現在你的手機螢幕上。
感謝您的瀏覽,我們明天見!